隐私计算在普惠金融领域的应用研究
The following article is from 信息通信技术与政策 Author 王雪,李武璐 等
作者简介
王雪
建信金融科技有限责任公司极速工场总经理,主要从事密码研究与开发工作。
李武璐
建信金融科技有限责任公司极速工场工程师,主要从事密码研究与开发工作。
李原
建信金融科技有限责任公司极速工场工程师,主要从事隐私计算技术在金融场景分析与应用的研究工作。
何林芳
建信金融科技有限责任公司极速工场工程师,主要从事隐私计算产品设计工作。
刘春伟
建信金融科技有限责任公司极速工场工程师,主要从事隐私计算技术架构与开发工作。
李思思
建信金融科技有限责任公司极速工场工程师,主要从事隐私计算相关研究与生态合作工作。
论文引用格式:
王雪, 李武璐, 李原, 等. 隐私计算在普惠金融领域的应用研究[J]. 信息通信技术与政策, 2022,48(5):53-59.
隐私计算在普惠金融领域的应用研究
王雪 李武璐 李原 何林芳 刘春伟 李思思
(建信金融科技有限责任公司极速工场,北京 100034)
摘要:为推动普惠金融业务更好地开展,跨机构、跨行业之间的数据融合必不可少,隐私计算技术实现数据可用不可见、数据不动价值动方面具有非常显著的优势,在金融行业尤其是普惠金融方面的应用场景广泛。对多源数据融合对于普惠金融发展的作用和意义,以及隐私计算技术在普惠金融业务链条中的主要应用场景和实践进行了介绍,并对目前技术发展面临的挑战进行了阐述。
关键词:普惠金融;隐私计算;金融;数据融合
中图分类号:TP309.2 文献标志码:A
引用格式:王雪, 李武璐, 李原, 等. 隐私计算在普惠金融领域的应用研究[J]. 信息通信技术与政策, 2022,48(5):53-59.
DOI:10.12267/j.issn.2096-5931.2022.05.007
0 引言
根据国务院的定义,普惠金融是指立足机会平等要求和商业可持续原则,以可负担的成本为有金融服务需求的社会各阶层和群体提供适当、有效的金融服务[1]。因此,包括小微企业、农民、城镇低收入人群、贫困人群和残疾人、老年人等在内的特殊群体都是我国普惠金融的重要服务对象,尤其是在新冠肺炎疫情冲击下,大量小微企业、个体工商户及新型农业主体出现现金流紧张,金融资源配置仍存在不合理不平衡不充分的情况。因此,国家大力倡导“深化金融供给侧结构性改革,增强金融普惠性”,中国银行保险监督管理委员会也对商业银行的普惠贷款业务提出了“两增两控”目标[2]。同时,金融系统为坚决贯彻党中央、国务院决策部署,强化稳企业保就业金融支持,致力于实现中小微企业融资量增、面扩、价降、提质,满足小微企业、高新技术企业、新型农业主体的合理融资需求,为我国实体经济进一步恢复发展提供有力支撑,在国家和市场的双重需求之下,普惠金融业务成为各商业银行的重要发力点。
普惠金融业务的开展,金融机构面临最核心的挑战在于:一是风险管控上,小微企业、个体工商户、新型农业主体受大环境影响较大,经营不稳定,缺乏有效抵质押物,同时缺乏标准的可用于信用风险评价的信息,各类信息分散于社会各个层面;二是经营成本管控上,相较大型企业,小微企业、个体工商户、新型农业主体贷款需求更加小额分散,且经营规范化较低,财务制度不健全,人员结构不稳定,获客与运营成本更高。因此,加速释放数据要素潜力、赋能普惠金融发展就成为了重中之重。
1 多源数据融合对于普惠金融发展的作用和意义
小微企业及个体工商户作为我国经济的“毛细血管”,在GDP、税收、技术创新和就业方面有显著贡献。新型农业主体作为我国乡村振兴的“主力军”,在推动城乡区域协调发展,不断优化经济布局方面作出了突出贡献[3]。普惠金融作为小微企业、个体工商户、新型农业主体融资的重要手段,需要继续加强信贷投放,继续执行贷款延期还本付息和信用贷款支持政策,控制其综合融资成本。当前,普惠金融常见的业务开展模式主要为依靠单类外部数据的线上贷款的模式。该模式为依赖税务、电力、保单等具有经营、金融属性的数据,通过流程再造、集约经营,实现业务线上一站式办理的模式。此种模式依赖的数据源单一,数据对接相对容易,但是存在数据缺失或者失真导致的风险,同时该模式下资金用途也难以管控。另外,有逐步发展出的场景化普惠金融,主要围绕“衣食住行养医”等民生场景,从源头核心嵌入产业链,依托产业互联网实现线上批量化获客。这类模式可以有效管控资金用途控制风险。无论哪种线上业务的开展,都需要多源的外部数据,如政务数据、各类行业产业数据、各类经营主体数据等。
随着国务院将数据纳入第五大生产要素的改革方向和相关体制机制建设的不断落地[4],数据安全与隐私保护相关法规政策的不断趋严,出于安全、隐私、合规方面的限制,机构间难以对各方数据进行有效融合与利用,因此产生了日益严重的“数据孤岛”问题,造成了各方的数据资源和价值无法充分被发掘的现状。为了解决在数据安全隐私前提下的数据融合与价值发掘问题,隐私保护计算技术提供了新的信息共享方式,也逐渐受到各方的关注,先后出现了联邦学习、多方安全计算、可信执行环境、差分隐私等技术路线,为多方数据搭建安全融合通道,实现数据不出管理域,可用不可见[5],有助于在保护各方数据隐私,确保业务在合法合规的前提下进行数据隐私融合计算,保障数据安全隐私,提升数据应用能力与效率。
2 隐私计算技术在普惠金融领域的应用场景与实践分析
隐私计算技术主要是通过对交互的标签、特征、梯度等数据进行密码学处理,保证密文接收方或外部第三方无法恢复明文,同时直接基于密文进行计算并获得正确的计算结果,从而达到各参与方无需共享数据资源即可达成相关目的。从2019年开始,隐私计算技术便开始尝试应用于小微企业、个体工商户、新型农业经营主体的普惠金融服务领域当中。金融机构作为普惠金融业务的提供方也是实际场景的应用方,业务环节主要覆盖获客、申请、准入、授信、监控、催收、处置等全流程,需要融合多方外部数据加强在精准营销、欺诈监测、风险监控等典型应用场景方面的实践,进而提升模型和策略的应用效果,改善普惠金融服务的成本、效率和体验等。下面针对具体应用场景实践展开论述。
2.1 精准营销
近年来,随着普惠金融产品逐步线上化,营销业务也步入了智能时代,普惠金融所涉及的客群金融交易活跃,金融需求多样,而在实际营销中可直接获取数据维度不丰富、关联企业间数据未打通,导致金融机构无法精准筛选客户并提供满足客户需求的产品,因此需要引入外部数据开发智能化营销模型,促进客户价值挖掘提升。
针对以上痛点,目前金融机构在逐步探索集团内部的营销推广,并与地方政府机构合作,结合自身获取的金融属性相关数据,融合地方辖区企业的经营、司法、税务等信息,进一步丰富银行客户标签维度,合理定位客群,节省营销成本(见图1)。由于地方政务数据中包含辖区全量企业信息,能够覆盖银行普惠金融业务营销的客群,且与银行方获取的企业特征方面重叠度不高,因此目前金融机构在具体实践中通过与地方政府大数据中心合作,融合企业基本信息、征信信息、社保及公积金缴费信息、纳税信息、水电气使用信息等首先建立近400 个企业特征标签,进而通过单变量回归进行初筛,再通过业务含义及变量相关性进行进一步筛选,最终形成特征短清单后使用纵向联邦学习的方法[6]开展智能营销模型训练和预测,捕捉不同类别企业的偏好特征,丰富了普惠金融客群特征的同时也定位了目标企业,最终达成为相应企业提供适配普惠金融产品的重点营销目的,助力客户业务价值提升,在实际营销中针对经营情况适中的企业响应率相比单边模型提升约15%~20%,模型区分度AUC和KS等指标提升约5%~10%。
精准营销作为隐私计算技术的重要应用场景,其在集团内、区域内的应用价值逐步显现,通过多方数据融合建模可以深度挖掘企业特点,设计创新信贷、委托贷款、政府贴息等专项金融产品;通过精准营销手段为相关主体提供专项资金扶持,支持当地政府精准落实国家信贷投放政策,大大降低信息不对称的成本,实现各方多赢的联合营销目的,以此促进产业链延伸、价值链提升、供应链贯通,建立解决普惠金融相关主体融资难问题的长效机制,推动业务良性健康发展,实现稳增长、促就业、保民生的总体目标。
2.2 欺诈监测
近年来,随着大数据、人工智能、云计算、区块链等新技术在金融机构领域的应用,既为银行各项业务带来了重大转型,逐渐提升了普及度,同时也催生了欺诈产业链,线上与线下模式交融,传统和新型手法融合渗透,导致金融机构在普惠金融领域反欺诈面临的形势复杂严峻。当前,金融机构业务经营中面临的外部欺诈涉及的业务领域主要可以分为信贷欺诈和账户欺诈两类。信贷欺诈以骗取银行贷款及信用卡授信为主,主要风险为银行信贷资金损失;账户欺诈以涉赌涉诈等违规、异常账户支付交易等为主,主要风险为客户自有资金损失、监管合规处罚。目前,金融机构在欺诈监测方面主要面临的痛点呈现为两个方面:一是欺诈涉及的业务环节和机构较多,各机构间数据缺少有效融合应用,很难形成链条对欺诈行为进行追溯;二是欺诈具有团伙性和高对抗性,对反欺诈策略迭代要求较高。
针对以上两方面痛点,基于欺诈风险共治的“生态圈”,目前金融机构在逐步探索利用隐私计算技术融合运营商数据、社交数据、黑灰名单数据等,一方面通过隐匿查询技术获取工商、司法黑灰名单等信息融入规则引擎以丰富欺诈策略的应用效果;另一方面通过联邦学习构建反欺诈模型,整合异常交易和交互行为信息提升欺诈识别效果。目前,金融机构在具体实践中通过与地方政府大数据中心合作,融合企业基本信息、吊销及注销信息、失信信息、涉案信息、社保及公积金缴费异常信息、纳税异常信息、水电气使用异常信息、企业异常名录信息等,采用联邦学习集成树Secureboost算法通过训练进行自我学习集成10~20 棵树,并不断迭代计算每一个子项的权重值,将已知的欺诈信息和未知的风险信息有效联系起来并支持动态调整,从而主动发现潜在的欺诈风险。尝试的联合模型最终得到黑样本的覆盖率和准确率相比单方建模均有约8%~25%的提升,达成了为筑牢“反欺诈”防火墙添砖加瓦的目的,同时具有较高的社会经济效益(见图2)。
欺诈监测作为隐私计算技术的典型应用场景,经济意义和社会价值凸显。利用隐私计算技术融合多方数据,促进了银行机构之间、银行机构与社会公共管理部门之间的反欺诈协作机制,在电信欺诈、盗刷、骗贷、虚假交易、薅羊毛等多个特定场景中进一步挖掘典型欺诈特征,找寻潜在疑似欺诈用户,提高欺诈侦测识别能力,从而及时制止重大风险事件的发生,挽回经济损失,为促进社会和谐稳定保驾护航。
2.3 风险监控
随着金融机构对信贷业务风险管控维度的提升,存量数据无法满足当前的场景需求,需要引入多方外部数据利用前瞻性数字技术开发融合模型,从而深度赋能小微企业、个体工商户、新型农业主体等普惠金融业务主要客群,逐步构建符合客群特定属性特征的智慧风控体系,推动金融改革创新与经济转型升级互促共进。目前,金融机构在风控方面的痛点主要体现在以下两个方面:一方面,金融机构传统的评分卡模型对于普惠金融业务客群普遍存在数据维度缺乏、数据量较少等情况,而随着实际金融产品及渠道的不断丰富,客户在金融机构内留存的金融业务数据难以满足新的风控需求;另一方面,在联合外部数据优化当前风控模型的过程中,出于不同机构间数据分散及保护等多方面原因,金融机构之间以及金融机构与其他行业机构之间的数据融合壁垒较高,“数据孤岛”现象严重,间接提升了机构之间的数据交互难度。
综合以上两方面痛点,目前主要开展了以下两方面工作:一方面基于人工智能、物联网、云计算等创新技术的赋能提升对于农业生产、商户流量等传统难以分析的场景数据的收集;另一方面基于隐私计算技术实现金融机构与多个数据提供方合作,融合多维度数据开展联合分析,从而实现风控模型效果的优化提升。目前,金融机构在具体实践中通过与地方政府大数据中心合作,联合工商、司法、税务、公积金、社保等多维度数据优化提升小微企业、个体工商户的评分卡模型效果。建模过程首先在多方不公开各自数据的前提下确认共有的交集用户,进而对共有样本的原始数据进行特征加工及分箱[7],通过纵向联邦学习在不暴露任何原始数据及特征分箱结果的情况下,得到群体WOE和IV等统计信息,解决特征之间量纲化问题,在隐私的条件下融合多方特征尝试构建逻辑回归模型以及XGBoost模型以提升区分效果(见图3)。最终优化后评分卡模型相比单方建模在AUC和KS等预测效果指标层面分别提升约5%~10%,能够更有效、更准确地识别高风险客户,降低违约风险,提升普惠金融的风控效果。
风险监控作为隐私计算技术在金融领域的一个重要应用场景,其应用价值和意义已逐步凸显,主要体现在以下两个方面:一是可以跨机构间数据特征价值的联合挖掘,解决单个机构样本量有限的问题,形成在相关场景中的全局认知,提升模型精准度;二是可以在各方原始特征不出域的前提下融合数据建立模型,更好地构建客户画像以分析客户的综合情况,交叉验证信息真实性,侦测逾期和违约的潜在因素等业务背景,形成对业务场景风控情况的多维度认识,从而综合提升金融机构对信用贷款等产品的风控能力和风控质量,进而形成外部数据赋能金融机构风控应用的典型范例。
3 隐私计算面临的挑战与展望
普惠金融业务链条涉及多个流程环节,并均有内外部数据融合的需求和要求。企业级隐私计算平台需要满足以上各个业务环节中的特定场景要求,包括多种数据源的对接,参与方身份主体的管理,计算过程的可监管、可审计,隐私计算算子的可插拔等。隐私计算平台目前正在多个普惠金融场景中开展验证,并逐步释放其能力和作用。虽然隐私计算技术已越来越多地得到试点和应用,但仍然面临一定的挑战。
3.1 技术方面
隐私计算技术发展迅速,技术路线多样,互联互通难度大。隐私计算技术发展至今,呈现出多种技术路线和算法流派,如多方安全计算、联邦学习、可信执行环境等技术路线,以及基于秘密分享、混淆电路、同态加密、差分隐私等的底层算法。各技术路线在功能、性能、安全性等方面都有所侧重,算法和技术在短期内难以得到统一,从而造成各个技术流派难以真正在算法层面互联互通。此外,当前主流的隐私计算框架和架构也呈现出多样化发展的趋势,既有支持点对点计算的直连计算架构,也有适配可信计算中心的代理计算架构,多种计算架构并存,短期内无法得到统一,需要针对不同的应用场景综合考量可扩展性、可监管性、成本、运营模式等各方面因素选取适配的架构。
隐私计算性能较低,对使用场景有一定的限制。基于隐私计算的技术特性,在进行计算的过程中会产生更多的通信以及计算负荷,相比于明文计算会带来数倍乃至数十倍的性能下降,在处理海量数据的场景下对硬件和网络带宽的依赖较大,在部分无法单独设置服务器和专线网络的场景下难以发挥功效。此外,由于技术发展所限,隐私计算仍难以完备地支持多方隐私图计算、图挖掘等场景应用,在功能完善和性能优化方面存在较多的探索空间。
隐私计算抗恶意攻击安全性不足。近年来,隐私理论和技术虽然取得了一定的进展,但是目前多数隐私计算平台产品所使用的底层算法和密码技术都无法完全抵抗恶意攻击,仅依赖于半诚实模型(Semi-Honest Model)[8],即假设隐私计算各参与方忠实执行隐私计算算法,不进行篡改、重放、伪造、合谋等恶意攻击。所以,对于场景合作方选择上,尽量选择安全性和可靠性更高的机构,并考虑当其他参与方进行恶意攻击时造成的不利影响和应对措施。
3.2 生态与产业发展方面
随着隐私计算技术的不断发展创新,尤其是在数据作为第五类生产要素[9]的地位得到进一步明确之后,业务形态更加复杂,数据处理的角色更加多元,系统、业务、组织边界更加模糊,数据生产、流动、处理等过程更加丰富,在隐私计算生态与产业发展层面逐渐显现出一些亟待解决的问题。例如,在数据生产、采集、存储、分析、使用等全生命周期运作过程中,责任主体将变得不清晰,责任边界将变得模糊,数据的处理活动将变得难以控制;此外,多方数据业务协作也会涉及到牌照、资质、个人数据授权等方面的约束,相关业务的合规性需要谨慎评估。与此同时,数据作为一种新型资产,其价值是促成数据交易的关键因素之一,然而数据交易市场正处于快速发展的早期阶段,明确的数据资产定价方法、合理的激励机制、利益分配机制等政策尚未落地,这对于隐私计算参与方对数据交易和流通带来的收益难以预估,降低了参与方的积极性。
针对以上挑战,未来一方面要进一步加强技术攻关,有效提高隐私计算技术的性能、精度和安全性;推进隐私计算技术标准化进程,促进各技术路线互联互通;加强隐私计算与人工智能、区块链、边缘计算等金融科技进行融合发展,加速形成体系化的技术解决方案;另外,针对普惠金融的业务特点,积极探索与政务、运营商、能源、互联网等外部数据的深入合作,联合研究面向场景的联合查询、联合运算、联合建模等应用范式,充分调动各方的参与积极性,切实为金融科技赋能中小微企业和个体工商户发挥更好作用。此外,在生态建设方面要加速培育金融业的数据要素市场,加强行业数据共享流通合作,提升金融数据资源价值以及提高数据安全保护能力。其中,建议监管部门开展数据隐私安全共享的顶层制度建设,进而逐步推动隐私计算在各行各业的应用发展;建议金融业监管部委鼓励金融机构开展试点探索,快速推动并形成适合行业数据发展的路径;建议鼓励金融机构和金融科技公司加强安全多方计算、联邦学习等隐私计算数据流通关键技术攻关和试点应用,推动形成跨部门、跨行业的数据流通生态。
4 结束语
本文主要介绍了普惠金融的业务特点、基于隐私计算的数据融合在普惠金融业务链条中的场景、作用和意义,以及隐私计算目前仍然面临的挑战和展望。隐私计算可以解决普惠金融业务中数据协同和融合过程中数据泄露的问题,并在满足国家法律合规政策的前提下实现多方数据价值最大化,在未来多种金融业务场景中将发挥越来越重要的作用。
参考文献
[1] 艾瑞咨询. 疫情观察:中国中小微企业数字化升级研究报告[R], 2020.[2] 中国银行业监督管理委员会. 中国银监会办公厅关于2018年推动银行业小微企业金融服务高质量发展的通知[EB/OL]. (2018-02-11)[2022-02-20].http://www.cbirc.gov.cn/cn/view/pages/govermentDetail.html?docId=271825&itemId=861&generaltype=1.[3] 清华大学互联网产业研究院. 小微企业信贷服务模式分析报告[R], 2019.[4] 中共中央国务院. 关于构建更加完善的要素市场化配置体制机制的意见[EB/OL]. (2020-04-09)[2022-03-17]. http://www.gov.cn/zhengce/2020-04/09/content_5500622.htm.[5] 北京金融科技产业联盟. 隐私计算技术金融应用研究报告[R], 2022.[6] 杨强, 刘洋, 程勇. 联邦学习[M]. 北京:电子工业出版社, 2020.[7] 梅子行. 智能风控: 原理、算法与工程实践[M]. 北京:机械工业出版社, 2020.[8] 冯登国, 裴定一. 密码学导引[M]. 北京:科学出版社, 1999.[9] 施羽暇. 培育数据要素市场的现状,问题与建议[J].信息通信技术与政策, 2022,48(1):19-23.
Analysis of privacy preserving computing in inclusive finance
WANG Xue, LI Wulu, LI Yuan, HE Linfang, LIU Chunwei, LI Sisi
(Finovation in CCBFT, Beijing 100034, China)
Abstract: It is essential of data integration between cross institutions and cross industries to promote the betterdevelopment of Inclusive Finance business. Privacy preserving computing technology has significant advantages toenable the secure computation of the data without revealing the content of the data. It is widely used in the financialindustry, especially in inclusive finance. This article introduces the function and significance of multi-source dataintegration for the development of inclusive finance, as well as the main practices of privacy preserving computingtechnology. Also, it specifies current technology challenges. Keywords: inclusive finance; privacy preserving computing; finance; data integratio
END
隐私计算头条周刊(7.3-7.9)
招标 | 近期隐私计算项目招标14(数据资产、运营商、航运)
《上海市数字经济发展“十四五”规划》:突破数字安全技术,深化隐私计算技术研发应用
热门文章:
姚期智院士:数据、算法、算力为何是数字经济核心技术?
图灵奖获得者、中科院院士姚期智:只有数据要素流通起来才能产生大规模的经济价值